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SYSTEME DE DETECTION DES INTERACTIONS PROTEINE-PROTEINE 

L' invention a pour objet un systeme de detection des interactions proteine- 
proteine, et plus particulierement des sequences d'ADN pour la mise en oeuvre 
de ce systeme, ainsi que des hotes cellulaires contenant lesdites sequences 
d'ADN. 

Les interactions proteine-proteine jouent un role fondamental chez les 
organismes vivants superieurs tant au niveau du developpement normal de 
Torganisme qu'au niveau de certaines situations pathologiques. Les methodes 
biochimiques et biophysiques existantes exigent d'une part que les differents 
partenaires aient ete prealablement identifies et, d' autre part, necessitent de 
grandes quantites de proteines (done leur clonage et leur purification). II est 
done indispensable de disposer d'outils permettant de realiser Tetape initiate, 
c'est-a-dire permettant d' identifier et de doner des proteines interagissant entre 
eiles, De tels systemes ont ete recemment developpes en utilisant la levure 
comme bote et T activation de la transcription d'un gene specifique comme 
"sonde" (voir Fields et Sternglanz, 1994). Cependant, quoique deja bien utilise, 
ce systeme presente certaines limites. 

L' etude de ces interactions proteine-proteine pent se faire en utilisant des 
techniques biochimiques et biophysiques in vitro. Mais celles-ci ne sont 
concevables que lorsque les proteines sont donees et peuvent etre produites et 
purifiees en grande quantite. D' autre part, dies ne permettent pas d' identifier de 
nouveau partenaire d' interaction. 

Une alternative attrayante aux methodes biochimiques consiste en une 
utilisation de banques d' expression d'ADNc (refletant T ensemble des ARN 
messagers) ou d'ADN genomique. L'avantage de ces strategies reside dans le 
fait que les genes des proteines ainsi identifiees sont immediatement disponibles 
(pour une comparaison de ces methodes voir Phizicky et Fields, 1995). Parmi 
les methodes s'appuyant sur I'utilisation de banques d'expression, on pent 
distinguer celles qui utilisent une selection in vitro (comme la revelation de 
plages de lyse par une proteine purifiee et marquee radioactivement interagissant 
avec une proteine inconnue) de celles utilisant une selection in vivo, Dans ce 
dernier domaine, des progres sensibles ont pu etre realises grace a la technique 
du "double-hybride" dans la levure (Ma et Ptashne, 1988; Fields et Song, 1989; 
Chien et aL, 1991; Gyuris et aL, 1993; Durfee et aL, 1993; Vojtek et al, 
1993; Le Douarin et aL, 1995), 
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Dans le systeme deveioppe par Fields et Song (1989), permettant 
d'identifier in vivo chez la levure des proteines interagissant entre elles, une 
proteine X connue est greffee sur un domaine de fixation a I'ADN (GaI4 ou 
LexA) et on cherche une deuxieme proteine Y (greffee sur un domaine de 
I'activation ou "AD-activation domain" de la transcription) capable d'interagir 
avec la proteine X et de provoquer ainsi I'activation de la transcription Dans 
une revue. Fields S. et Sternglanz R. ("The two-hybrid system: an assay for 
protein-protein interaction" (1994) TIG, lfl:286-292) discutent les possibilites et 
les limites de cette methode. Une des limites est que les deux proteines hybrides 
doivent parvenir dans le noyau de la cellule. L'autre difficulte majeure consiste 
k identifier des proteines Y qui interagissent avec une proteine X pourvue d'un 
domaine d'activation de la transcription, puisque, dans ce cas, la proteine cible 
(Gal4-X ou LexA-X) donnera un signal d'activation constitutif en absence de 
toute proteine Y. 

S'agissant de Gal4 comme support de fixation a I'ADN, elle a ete 
mitialement mise au point en utilisant le domaine de fixation a I'ADN ou DBD 
("DNA binding domain") de la proteine Gal4 (Ma et Ptashne, 1988; Fields et 
Song, 1989). Gal4 est une proteine modulaire de 881 acides amines possedant 
au moins deux domaines fonctionnels. Un domaine de fixation a I'ADN 
comprenant les acides amines 1-94 et un domaine d'activation de la 
transcription. La fonction d'activation est en fait repartie sur trois segments 
diff^rents de la proteine, a savoir 94-106, 148-196 et 768-881 (Marmorstein et 
aL, 1992). La structure de Gal4i.65 impliquee dans un complexe avec I'ADN a 
ete determinee par cristallographique aux rayons X (Marmorstein et aL, 1992) 
tandis que la structure du domaine d'activation reste tres mal d6finie. 

Ainsi, Fields et Song (1989) ont greffe, d'une part la proteine SNFl (une 
serine/threonine kinase) sur Gal4i_i47, et d'autre part la proteine SNF4 sur le 
domaine d'activation 768-881 de Gal4. Aucune des deux proteines hybrides, 
Gal4i_i47-SNF1 ou SNF4-Gal4768.88i seules n'etaient capable d'activer la 
transcription du g^ne reporter /acZ place sous le controle du promoteur GALL 
Par contre la coexpression des deux proteines hybrides a abouti a une activation 
de la transcription notable (180 unites), bien que nettement inferieure a 
I'activation observee avec la proteine Gal4 entiere (4000 unites). Cette 
difference est imputable, d'une part a I'absence du domaine d'activation 
comprenant les acides amines 148-196 et. d'autre part, au fait que I'interaction 
entre SNFI et SNF4 ne remplace pas completement une liaison covalente emre 
les deux domaines de Gal4. Une fusion directe entre Gal4 1.147 et Gal4768-881 
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provoque en effet seulement une reduction d'un facteur 2 par rapport a Gal4 
entier (Ma et Ptashne, 1987a). 

Depuis, des dizaines de couples de proteines X,Y ont ete testees. De 
nombreuses combinaisons sont capables de restituer un activateur fonctionnel de 
la transcription (pour une revue, voir Bartel et al., 1993). 

Outre I'analyse de I'interaction d'un couple de proteines connues, la 
technique du double-hybride permet egalement 1' identification d'un partenaire 
inconnu du moment ou on est en possession du gene de la proteine cible X. 
L'equipe de Stanley Fields a ete la premiere a exploiter cette possibilite (Chien 
et al., 1991) en creant des fusions entre le domaine d'activation 768-881 de 
Gal4 et des sequences proteiques codecs par des fragments d'ADN d'une banque 
d'ADN genomique de levure. Cette fois-ci, le domaine d'activation a ete place 
en extremite NH2-terminale de cette famille de proteines de fusion, afin de 
faciliter la construction des proteines hybrides. 

Afin d'eviter un trop grand nombre de clones faux-positifs, il est 
preferable d'inserer la banque dans le plasmide portant le domaine d'activation, 
puisque Ma et Ptashne (1987b) avaient montre auparavant, que de nombreux 
fragments proteiques fusionnes aux 147 premiers acides amines de Gal4 etaient 
capables d'activer la transcription. 

Depuis I'article de Chien et al. (1991) les souches et plasmides utilises ont 
evolue. Notamment la combinaison d'une selection metabolique associee a un 
crible lacZ s'est generalisee. Tandis que Chien et al. (1991) travaillaient 
uniquement sur la base du crible lacZ, des approches plus recentes utilisent 
egalement I'acquisition de la capacite a pousser sur un milieu manquant soit 
d'histidine, soit de leucine. En principe seules les cellules portant une proteine 
hybride issue de la banque. capable d'activer I'expression du gene de selection 
(His3, Leu2) via une interaction X,Y formeront des colonies sur boite. Une telle 
selection permet I'analyse d'un plus grand nombre de clones. 

Parallelement a Gal4i.i47 conune support de fixation a I'ADN, l'equipe 
de Roger Brent (Harvard Medical School) a introduit le r^presseur LexA 
d' Escherichia coli comme support (Golemis et Brent, 1992 ; Gyuris et al., 
1993). 

LexA est une proteine de 202 acides amines, composee de deux domaines 
relies par une region charniere d'environ 30 acides amines. Les 70 premiers 
acides amines constituent le domaine de fixation a I'ADN (Hurstel et al., 1986; 
Fogh et al., 1994) et les acides amines 100 a 202 forment le domaine de 
dimerisation de la proteine (Schnarr et al., 1985). LexA reconnait des sites 
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pah„drom,<,ues .„r TADN (las opera,=urs SOS) e. pluMeurs op«ra.eurs 
adjacems peuvem =,re occupes d^une fa,o„ c«,pera<ive (Uoubis e, a, '99, 

L uflxsacion de I^xA conma support de fixation a I'ADN peut avoir 

CO/0, n affecte pas la cro.ssance de la levure, „e possede pas d'activite 
.ranscr«,„o™elle r^siduel.e (co-^e le segmem 94-106 de Ga,4) e, peuH^^ 
un hse a„s des souches de levure ,a/+. De ce fai.. une des pro, ,nes^; 

controle de Gal4. M^,. ,a pro.e,„e hybrlde sera exprimee uniquenent en 
p«se,^ de galactose, mais pas en presence de glucose. Le domalne d'activation 
ut hse par requtpe de Roger Bren. es. agalenren. issu .'EscHericHia J , 
s agn d un des don«i„es acivateurs artiflciels Isoles par Ma e. Plashne (1987b) 
Ce domame (non^e B42) possede un po.e„,iel d'acivation plus faible que les 
doma-nes d-activa,ion de Ga,4 ou de VP.6, ce qui pennec d'^viter les p obl^e 
d= .ox,c,te hes a un eventue, "squelching" (la toa.ion d'un eleven, essentierde 

7" ™ d-activation). U„e description 

ecente du systeme double-hybride s'appuyant sur Putilisation de Lexl se 
trouve dans Golemis el al. (1996) et Golemis et Brent (1996) 

neu d^„T " "^^ """^'^ double-hybride. 

peu d cBrdes on. ete menees cherchan. a corriler des dom^s obtenues /„ Wv^ 
avec des mesures d'afftnite i„ »,ro. Estojak e, a, (1995) ont cherche a etablir 
une telle correlation dans le cas de plusieurs proteines , helice-loop-hflice 
(Myc, Max. Mx,) et dans le cas de mutants du r^presseur lambda Leurs 
resultats soni quelque peu ddcevants. 

En effet, le systime double-hybride montre une forte polariti pour le 
couple Myc/Max. U,rsque Myc est fixi sur DBD e, Max sur AD aucut^e 

sur DBD et Myc sur AD. on observe une activation en accord avec des donnfcs 
btochtrntques nrontrant que les deux proteines interagissent. Lorsque cette 
derntere geometne est utilisee avec des reporters U,cZ ayan, un nombre variable 
d o„s en atnont du g*ne, la hientrchie des affimt6s apparentes in ^.o 
entr ies couples Max/Myc et Max/Mxi n^est pas la meme selon le reponer 

lan-hH"" ""^ """-"^ du r^presseur 

c«^ntc?!l ~ ~ amoindrie 

1995) Par atUeurs. bten que tons les variants activen. assez fortement le gene 
iacZ. trots sur quatre sont incapables d'activer le giine leu2 et autaien, de ce 
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fait, echappe a une selection sur milieu depourvu de leucine. En conclusion, 
Estojak et al. (1995) estiment qu'aucun gene reporter montre une correlation 
satisfaisante avec les affinites mesurees in vitro. 

Etant donne la complexite de Tassemblage d'un complexe d' initiation de la 
transcription chez les eucaryotes (voir : Hori et Carey, 1994 ; Maldonado et 
Reinberg, 1995) qui mobilise au moins une trentaine de proteines differentes, et 
le fonctionnement toujours mal compris des activateurs de la transcription, ces 
resultats ne sont pas tellement surprenants. 

Lex A est le represseur du systeme SOS chez E,coli, Lex A, compose de 
deux domaines, est inactive in vivo suite a des dommages sur I'ADN par un 
clivage proteolytique localise entre les deux domaines (pour une revue sur 
LexA, voir Schnarr et Granger-Schnarr, 1993). La separation du domaine de 
fixation a TADN du domaine de dimerisation entraine alors une diminution de 
Taffinite pour I'ADN d'environ 1000-fois, ne permettant plus une repression 
transcriptionnelle efficace. D'autre part, la constante de dimerisation de LexA 
(KA = 2 X 104 M-1) est relativement faible (Schnarr et al,, 1985), ce qui 
suggere que la greffe d'un domaine de dimerisation heterologue a af finite 
modeste devrait reconstituer un represseur hy bride fonctionnel, Schmidt-Dorr et 
al. (1991) ont pu montrer en effet que la fusion de la glissiere a leucine 
("leucine-zipper") de I'oncoproteine Jun a LexAi.gy restaure une repression 
transcriptionnelle. Par contre, la fusion de la glissiere a leucine Fos ("leucine- 
zipper Fos"), qui est incapable de conferer I'homodimerisation, ne restaure pas 
la repression (Porte et al., 1995). En partant de cette observation, la partie 
glissiere de Fos ("Fos-zipper") de la proteine de fusion a ensuite ete 
mutageneisee, afin de caracteriser les anti-determinants de I'homodimerisation 
de Fos (Porte et al , 1995). 

La souche bacterienne indicatrice est deficiente en LexA et porte le gene 
lacZ sous le controle d*un operateur SOS reconnu par LexA (I'operateur sulA). 
La proteine hybride, placee sous le controle du promoteur lacUVS inductible par 
riPTG, est produite a partir d'un plasmide de fa?on a pouvoir adapter la 
quantite de proteine aux necessites experimentales. Ce systeme est parfaitement 
adapte a I'etude d'un complexe homodimerique, mais son utilisation devient 
laborieuse du moment ou Ton veut etudier I'heterodimerisation entre deux 
proteines differentes capables de former egalement des homodimeres. 

Parallelement au systeme LexA, I'equipe de James Hu a developpe une 
approche voisine en utilisant le domaine de fixation a I'ADN du represseur 
lambda (Hu, 1995). L'avantage de ce systeme est d'offrir les possibilites de 
selection du phage lambda. Son inconvenient reside dans le fait que le domaine 
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de fixation a I'ADN du represseur lambda contient deja un element de 
dimerisation (I'helice 5), qui peut masquer I'effet de domaines de dimerisation 
heterologues relativement faibles. 

L'invention a notamment pour objet de resoudre les difficultes presentees 
par les systemes de I'art ant^rieur et. en particulier, l'invention a pour but de 
permettre I'etude de rheterodimerisation. 

L'invention a pour objet un systems permettant la detection d'interaction 
entre deux proteines greffees, par visualisation de la repression de la 
transcription et non pas par una activation de la transcription. En effet 
contrairement au systeme levure, une proteine ayant une activite activatrice 
intrinseque pourrait etre utilisee. 

L'invention a pour objet un systeme de detection des interactions proteine- 
proteme a I'aide d'une bacterie {Escherichia coli) comme organisme bote 
couramment utilisee dans tous les laboratoires de biologic moleculaire. 

L'invention a pour objet un systeme de detection des interactions proteine- 
proteine evitant le probleme de I'adressage des proteines de fiasion dans le noyau 
comme c'est le cas dans la levure et ce. grace a la non-compartimentation d'£ 
coh, notamment a I'absence d'un noyau structure. 

L'invention a pour objet un systeme adapte a I'etude des interactions de 
proteines situees dans la membrane cytoplasmique. 

L'invention a pour objet un test (repression de la transcription) permettant 
potentiellement 1' identification de proteines interagissant avec les domaines 
d'activation des facteurs de transcription, parmi lesquels on trouve de nombreux 
produits oncogeniques impliques dans la cancerogenese, comme Jun. Fos ou les 
membres de la famille Ets. 

L'invention a pour objet un systeme d'etude d'interaction proteine- 
proteme (determination des forces d'interaction, identification des elements de 
structure ou de sequence importants pour cette interaction, analyse de la 
specificite de 1' interaction) plus fiable que le systeme levure (Estojak et al. 

1995). 

L'invention a pour objet un systeme d'etude d'interaction proteine- 
proteine permettam de detecter des interactions lorsque la proteine "hamefon" 
(celle pour laquelle on recherche le ou les partenaires) a des capacites 
mtnnseques d'activation de la transcription (revues Bartel et al. 1993 Golemis 
et Brent 1996, Golemis et al. 1996) et ceci se produisant assez frequemment 
(Ma et Ptashne 1988). et done l'invention a pour objet un systeme permettant 
retude des interactions d'un "vrai" domaine d'activation de la transcription ■ 
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L' invention a pour objet un systeme de detection d* interaction proteine- 
proteine permettant I'examen d'un grand nombre de clones (>10*) grace a 
I'efficacite de transfection de E, Coli qui est nettement superieure a celle de la 
levure (de I'ordre de 1 000 fois) et ainsi le criblage de banques d'ADNc ou 
d'ADN genomique. 

L' invention concerne T utilisation d'une sequence d'ADN comprenant : 

- une sequence nucleotidique codant pour une proteine indicatrice (gene 
indicateur), 

- un promoteur, 

- un operateur mute, 

ladite sequence nucleotidique etant sous le controle du susdit promoteur 
comprenant le susdit operateur mute contenant deux sequences et derivant d'un 
operateur contenant deux sequences repetees inversees (palindrome), cet 
operateur etant tel que, a I'etat non mute (sauvage), il entraine la repression de 
la transcription du gene indicateur, lorsque des proteines regulatrices sous forme 
d'homodimere se fixent sur chacune desdites sequences repetees inversees via 
leur site de fixation a TADN, cet operateur mute etant tel que Tune de ses 
sequences est mutee (mutation 1), tandis que 1' autre est a I'etat sauvage, ou 
mutee de fagon silencieuse ou comporte une mutation differente (mutation 2) de 
la susdite mutation 1 , la transcription du gene indicateur etant reprimee par des 
proteines regulatrices sous forme d'heterodimeres via leur site de fixation a 
TADN, chaque monomere de ces heterodimeres etant tel qu'il reconnaisse 
specifiquement Tun la sequence comportant la mutation 1, i' autre la sequence 
qui est a Tetat sauvage, ou qui est mute de fagon silencieuse ou qui comporte 
une mutation 2, les homodimeres susceptibles d'etre formes a partir de chacun 
des monomeres etant incapables de reprimer la transcription du susdit gene 
indicateur, 

- pour detecter ou quantifier des interactions entre deux proteines ou 
domaines proteiques, ou cribler des proteines ou domaines proteiques presentant 
des interactions avec une proteine ou domaine proteique determine(e), ces 
interactions etant revelees lorsqu41 y a repression de la transcription du susdit 
gene indicateur, cette repression resultant de la formation d'heterodimeres 
comprenant : 

1) un premier monomere contenant une premiere proteine de fiision 
contenant le site de fixation a TADN d*une proteine regulatrice susceptible de 
reconnaitre specifiquement la sequence de T operateur mute contenant la 
mutation 1, le susdit site de fixation etant fusionne a Tune des deux proteines ou 
a I'un des deux domaines proteiques, implique(e) dans les susdites interactions, 
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2) un deuxieme monomere contenant une deuxieme proteine de ftision 
contenant le site de fixation a I'ADN d'une proteine regulatrice susceptible de 
reconnaitre specifiquement la sequence non mutee, ou mutee de fa?on 
sUencieuse ou comportant la mutation 2 de I'operateur mute, le susdit site de 
fixation etant ftisionne a I'autre des deux proteines ou a I'autre des deux 
domames proteiques, implique(e) dans les susdites interactions. 

L'utilisation selon Tinvention repose sur le fait qu'une proteine 
regulatrice, par exemple LexA, regule in vivo I 'expression de genes en se fixant 
sur des sequences specifiques situees en amont de ces genes (sequences 
operateur). 

L'operateur utilise dans le cadre de Tinvention est un operateur mute 
derivant d'un operateur non mute qui est tel que, a r6tat sauvage, ses sequences 
sont palindromiques (repetees inversees) et recomiues par des homodimeres de 
la proteine regulatrice. La proteine regulatrice, par exemple LexA, est organisee 
en deux domaines, un domaine de fixation a I'ADN qui reconnait 
specifiquement les sequences operateur et un domaine de dimerisation par lequel 
se font les interactions entre deux monomeres proteiques stabilisant Tinteraction 
des dimeres sur I'ADN. Chaque monomere se fixe sur un demi-operateur. Par 
"demi-operateur" on designe la sequence specifiquement reconnue par chaque 
monomere. Ces sequences specifiques sont identiques dans le cadre d'un 
operateur sauvage ou doublement mute, et differentes dans le cadre d'un 
operateur mute. 

Cette fixation est renforcee par 1 'existence de contacts entre les domaines 
de dimerisation de chaque monomere. Le domaine de fixation a I'ADN seul 
(depourvu du domaine de dimerisation) est incapable de fixer efficacement 
roperateur et done de reguler I'expression d'un gene. Si on remplace le 
domaine de dimerisation de LexA par des motifs proteiques heterologues mais 
susceptibles d'interagir, on restitue I'activite regulatrice de LexA. 

Ceci 6tant. dans le cadre de I'invention, la sequence operateur reconnue 
par une proteine regulatrice, par exemple LexA, a ete modifiee de telle sorte 
qu'un demi-operateur restant sauvage sera reconnu par la proteine regulatrice 
sauvage, par exemple LexA, tandis que I'autre demi-operateur sera mute et 
reconnu par une forme mutee de la proteine regulatrice. 

Chacun de ces domaines de fixation a I'ADN peut etre ftisionne a des 
domaines proteiques susceptibles d'heterodimeriser et toute interaction entre ces 
domaines est mesuree par une repression plus ou moins importante du gene 
indicateur (egalement designe par "gene reporter"). 

On entend par gene indicateur : 
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- soit un gene codant pour une proteine dont I'activite d'une part est 
revelee par la couleur qu'elle confere aux clones bacteriens la produisant et 
d' autre part peut etre dosee quantitativement, par exemple le gene lacZ, le gene 
codant pour la luciferase, 

- soit un gene codant pour une proteine toxique pour la bacterie de telle 
sorte que si la proteine est produite, la bacterie meure, par exemple le gene 
sulA. 

On peut egalement utiliser un systeme pour lequel : 

- le gene toxique est un gene codant pour une resistance a un antibiotique, 

- I'operateur mixte op408/opWT est place dans le promoteur du gene 
codant pour le represseur de ce gene de resistance a un antibiotique. 

En absence d'interaction entre LexA408-X et LexAWT-Y, le represseur 
du gene en question est produit, la bacterie ne peut pas pousser sur un milieu de 
culture contenant cet antibiotique. Dans le cas contraire. la synthese du 
represseur n'a pas lieu, le gene de resistance a I "antibiotique est produit et les 
bacteries donnent lieu a des colonies sur un milieu de culture contenant cet 
antibiotique. 

Par "homodimeres", on designe des associations non covalentes de 
proteines dans lesquelles les domaines d'interaction proteine-proteine sont 
identiques et lies de fa?on covalente a des domaines proteiques heterologues ou 
homologues de fixation de I'ADN, eux-memes identiques ou differents. 

Par "heterodimeres", on designe des associations non covalentes de 
proteines dans lesquelles les domaines d'interaction proteine-proteine sont 
differents et lies de fa?on covalente a des domaines proteiques h6t6rologues ou 
homologues de fixation de I'ADN, eux-memes identiques ou differents. 

Par "mutation silencieuse portee par I'une des sequences de I'operateur", 
on designe une mutation qui n'affecte pas la reconnaissance de ladite sequence 
par la proteine regulatrice sauvage. 

Par "mutation 2 portee par la sequence de I'operateur", on designe une 
mutation differente de la mutation 1, et qui est telle que la sequence comportant 
ladite mutation 2 est reconnue par une proteine regulatrice non susceptible de 
reconnaitre la sequence portant la mutation 1, la mutation 1 etant elle-meme 
telle qu'elle est reconnue par une proteine regulatrice qui n'est pas susceptible 
de recoimaitre la sequence portant la mutation 2. 

Par "interaction proteine-proteine", on designe 1' assemblage non covalent 
de deux (ou plusieurs) proteines par interaction Van der Waals (interactions 
electrostatiques entre charges opposees, liaisons hydrog^ne, interactions 
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1400 a 1600 A 2 (pour u„e revue voir: J. Janin "Principles of protein/protein 
recognition from structure to thermodynamics" 1995, Biochimie 27 497 505) 

Par "domaine de fixation a I'ADN d'une proteine", on definit la partie de 
la^proteine dont Tintagrit. est indispensable , sa fixation non covalente a 

Par "detection de 1' interaction", on designe une methode permettant de 
visuaiiser une interaction entre deux proteines. 

dech-ff' I'interaction", on designe une methode permettant 

de chiffrer la force de cette interaction. 

L-expression "proteine susceptible de reconnaitre la sequence d'un 
operateur" designe une proteine capable de faire des liaisons non covalentes 
avec une sequence particuliere d'ADN. 

L'expression -domaine de Hxation toiome a une proteine" d&igne un 
docame pro.eique relie par une liaison peptidique a une autre proteL o„ 
domaine de proteine. 

Selon un mode de realisation avantageux de I'invention, la proteine 
regu atnce est depourvue de son domaine de dimerisation, lequel peut toutefois 
etre tolere si les interactions resultant de la presence du domaine de dimerisation 
sont plus faibles que celles que I'on veut mettre en evidence. 

L'invention a egalement pour objet une sequence d'ADN comprenant • 

- une sequence nucleotidique codant pour une proteine indicatrice (gene 
mdicateur), ^ 

- un promoteur, 

- un operateur mute, 

ladite sequence nucleotidique etant sous le controle d'un promoteur comprenant 
un operateur mute contenant deux sequences et derivant d'un operateur 
contenant deux sequences rep^tees inversees (palindrome), cet operateur etant 
tel que, a 1 etat non mute (sauvage). il entraine la repression de la transcription 
du gene mdicateur. lorsque des proteines regulatrices sous fonne d'homodimere 
se fixent sur chacune desdites sequences rep6tees inversees via leur site de 
fixation a I'ADN, cet operateur mute etant tel que Tune de ses sequences est 
mmee (mutation 1). tandis que I'autre est a I'etat sauvage. ou mutee de fagon 
silencieuse ou comporte une mutation differente (mutation 2) de la susdite 
mutation 1. la transcription du gene indicateur etant r6primee par des proteines 
regulatrices sous forme d'hetdrodimeres via leur site de fixation a I'ADN 
chaque monomere de ces heterodimeres etant tel qu'il recomiaisse 
specifiquement I'un la sequence comportant la mutation 1. Tautre la sequence 
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qui est a I'etat sauvage, ou qui est mute de fa?on silencieuse ou qui comporte 
una mutation 2, les homodimeres susceptibles d'etre formes a partir de chacun 
des monomeres etant incapables de reprimer la transcription du susdit gene 
indicateur, 

ladite mutation 1 etant en outre telle qu'elle est reconnue specifiquement 
par une proteine regulatrice comportant un site de fixation a T ADN entrant dans 
la constitution d'une premiere proteine de fusion, lequel site de fixation est 
fusionne avec une proteine ou un domaine proteique susceptible d'interagir avec 
une autre proteine ou un autre domaine proteique entrant dans la constitution 
d'une deuxieme proteine de fusion contenant le site de fixation a TADN d'une 
proteine regulatrice susceptible de reconnaitre specifiquement la sequence non 
mutee, ou mutee de fa?on silencieuse ou comportant la mutation 2. 

L' invention concerne une sequence d^ADN caracterisee en ce qu'elle 
comprend un operateur mute contenant deux sequences et derivant d'un 
operateur contenant deux sequences repetees inversees (palindrome), I'une de 
ces deux sequences etant mutee, et T autre etant a fetat sauvage. 

La sequence mutee pent etre en amont ou en aval de la sequence a Tetat 
sauvage. 

invention a egalement pour objet une sequence d'ADN caracterisee en 
ce que 1' operateur mute contient les sequences suivantes : 

CCGT et ACAG 

espacees par une sequence d' environ 3 a environ 20 nucleotides, et notamment 
de 8 a 12, et avantageusement 8 nucleotides, et notamment caracterisee en ce 
que r operateur mute contient la sequence suivante : 

5'.CGGAATTCAATAGGGTTGATCTTTGTTGTCACTGGATGTACCGTACATCCATACAGTAACTCACAGGGGC-3' 

Les sequences CCGT et ACAG correspondent aux sequences 
respectivement CTGT et ACAG de T operateur non mute. 

La presente invention concerne une sequence d'ADN caracterisee en ce 

que 

la sequence nucleotidique codant pour la proteine indicatrice est le gene lacZ 
Chez E. coli, codant pour la p-galactosidase, 

foperateur mute contient deux sequences et derive d'un operateur contenant 
deux sequences repetees inversees (palindrome). Tune de ces deux sequences 
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etant mutee, et I'autre etant a I'etat sauvage, la sequence mutee etant de 
preference celle sihiee en aval de la sequence a I'etat sauvage, 

la sequence sauvage etant reconnuc specifiquement par la proteine LexA 
sauvage ou par un fragment de LexA contenant le site de fixation a I'ADN 
notamment un fragment defini par les positions 1 a x de LexA, x variant de 69 a 
87, et notamment par les fragments 1 a 69 ou 1 a 87 de LexA, 

et la sequence mutee etant reconnue par la proteine LexA mutee ou par un 
fragmem mute de LexA contenant le site de fixation a I'ADN, notamment un 
fragment mute de LexA correspondam a celui defini par les positions 1 a x de 
LexA, X variant de 69 a 87, et notamment par les fragments 1 a 69 ou 1 a 87 et 
les mutations de LexA etant avantageusement P40 A, N41 S A42 S 
le domaine de dimerisation de LexA etant absent a la fois de LexA ou dn 
fragment de LexA et de LexA mute ou du fragment mute de LexA. 

Les trois mutations simultanees P40 A, N41 ^ S, A42 -> S dans LexA 
donnent lieu a un mutant designe par LexA408. 

Par "domaine de dimerisation", on designe la partie de la proteine dont 
rmtegnte est indispensable a Tinteraction non covalente avec elle-meme 
(homodimere) ou avec un autre domaine de dimerisation (heterodimere). 

II est necessaire que le domaine de dimerisation de LexA et de LexA408 
ou du fragment utilise de LexA et de I^xA408 soient absents sinon lorsque les 
deux proteines (LexA et LexA408) sont coexprimees dans I'hote cellulaire 
implique dans I'invention, le gene indicateur serait reprime. 

La presente invention a egalement pour objet un complexe entre 
- une sequence d'ADN comprenant une sequence nucleotidique codant pour une 
proteme mdicatrice, ladite sequence nucl6otidique 6tant sous le controle d'un 
promoteur comprenant un operateur mute contenant deux sequences et derivant 
d'un operateur contenant deux sequences repetees inversees (palindrome), cet 
operateur etant tel que, a I'etat non mute (sauvage), il entraine la repression de 
la transcription du gene indicateur, lorsque des proteines regulatrices sous forme 
d homodmiere se fixent sur chacune desdites sequences repetees inversees via 
leur site de fixation a I'ADN, cet operateur mute 6tant tel que I'une de ses 
sequences est mutee (mutation 1), tandis que I'autre est a I'etat sauvage ou 
mutee de fa?on silencieuse ou comporte une mutation differente (mutation 2) de 
la susdite mutation 1, la transcription du gene indicateur etam reprimee par des 
proteines regulatrices sous forme d'heterodimeres via leur site de fixation a 
rADN, chaque monomere de ces heterodimeres etant tel qu'i] recomiaisse 
specifiquement I'un la sequence comportam la mutation 1, I'autre la sequence 
qui est a I'etat sauvage. ou qui est mute de fafon silencieuse ou qui comporte 
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une mutation 2, les homodimeres susceptibles d'etre fournis a partir de chacun 
des monomeres etant incapables de reprimer la transcription du susdit gene 
indicateur, 

- et des heterodimeres dont les monomeres les constituant (respectivement 
premier monomere et deuxieme monomere) sont impliques entre eux dans une 
interaction proteine/proteine : 

1) le premier monomere etant tel qu'il contient une premiere proteine de 
fusion contenant le site de fixation a I'ADN d'une proteine regulatrice 
susceptible de reconnaitre specifiquement la sequence de I'operateur mute 
contenant la mutation 1, le susdit site de fixation etant fusionne a I'une des deux 
proteines ou a I'un des deux domaines proteiques, implique(e) dans les susdites 
interactions, 

2) le deuxieme monomere etant tel qu'il contient une deuxieme proteine de 
fusion contenant le site de fixation a I'ADN d'une proteine regulatrice 
susceptible de reconnaitre specifiquement la sequence non mutee, ou mutee de 
fa?on silencieuse ou comportant la mutation 2 de I'operateur mute, le susdit site 
de fixation etant fusionne a 1' autre des deux prot6ines ou a 1' autre des deux 
domaines proteiques, implique(e) dans les susdites interactions. 

La presente invention concerne egalement un complexe caracterise en ce 

que : 

- la sequence d'ADN est telle que definie ci-dessus 
et en ce que 

- les heterodimeres contiennent : 

1) un monomere contenant une premiere proteine de fusion contenant le 
site de fixation a I'ADN de LexA mute ou d'un fragment mute de LexA 
reconnaissant la sequence de I'operateur mute contenant la mutation 1, lequel 
site de fixation est fusionne avec une proteine daerminee ou un fragment 
proteique determine susceptible d'etre implique dans une interaction tel que 
decrite ci-dessus, laquelle proteine ou lequel domaine proteique contient par 
example un domaine d' activation ou de dimerisation, 

2) un monomere contenant une deuxieme proteine de fusion contenant le 
site de fixation a I'ADN de LexA sauvage, ou porteur d'une mutation 
silencieuse ou d'une mutation 2 ou d'un fragment de LexA reconnaissant la 
sequence non mutee de LexA ou mutee de fa?on silencieuse ou comportant une 
mutation 2, lequel site de fixation est fusionne avec une proteine determinee ou 
un fragment proteique determine, contenant par exemple une proteine ou un 
domaine proteique susceptible d'interagir avec la proteine ou le fragment 
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proteique defini en 1) ou avec les susdits domaines d'activation ou de 
dimerisation. 

L-invention a egalement pour objet un hote cellulaire contenant une 
sequence d'ADN telle que decrite ci-dessus. 

L-invention a egalement pour objet un procede pour detecter et quantifier 
des interactions entre deux proteines ou fragments de proteines, caracterise 

- en ce que I'on met en presence des sequences nucleotidiques codant 
respectwement pour ,e premier et le deuxieme monomere contenant 
respecnvement une premiere et une deuxieme proteine de fusion telle que 
defime c-dessus avec une sequence d'ADN telle que decrite precedemment et 

- en ce que Von detecte I'eventuelle repression de la transcription du gene 
mdicateur tel que defmi ci-dessus, notamment par transfection d'un hote 
cellulaire tel que decrit ci-dessus, avec des vecteurs contenant. d'une part les 
susdites sequences nucleotidiques codant respectivemem pour le premier et le 
deuxieme monomere contenant respectivement la premiere et la deuxieme 
proteine de fusion et. d'autre part, les elements necessaires a I'expression des 
susdits monomeres. 

L'invention concerne un procede pour identifier une proteine interagissant 
avec une proteine determinee, caracterise 

- en ce que Ton met en presence les elements suivants : 

. une sequence nucleotidique codant pour un premier monomere 
contenant une premiere proteine de fusion entre. d une part, une proteine 
regulatrice selon l'invention et, d'autre part, la proteine determinee. 

. une banque genomique, contenant notamment des fragments d'ADN 
et notamment d'ADNc, chacun etant susceptible de coder pour une proteine 
interagissant avec la proteine determinee. chacun des differents elements de la 
banque genomique etant respectivement fusiomie a la sequence codant pour une 
proteine regulatrice telle que definie ci-dessus, 

. une sequence d'ADN selon l'invention, 

et 

- en ce que I'on detecte I'eventuelle repression de la transcription de la 
sequence nucleotidique codant pour une proteine indicatrice telle que decrite ci- 
dessus, notamment par transfection d'un hote cellulaire selon la presente 
invention, d'une part, avec un vecteur contenant la sequence nucleotidique 
codant pour le susdit premier monomere contenant la premiere proteine de 
fusion et, d'autre part, un ensemble de vecteurs contenant une sequence 
nucleotidique codant pour un deuxieme monomere contenant une deuxieme 
proteine de fusion, chaque sequence nucleotidique codant pour chaque deuxieme 
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monomere contenant la sequence nucleotidique codant pour la proteine 
regulatrice selon la presente invention, et en aval de celle-ci Tun des elements 
d'ADN de la susdite banque, tous les vecteurs contenant en outre les elements 
necessaires a I'expression des susdits monomeres. 

Ce precede fait I'objet de Texemple ci-apres. Dans cet exemple, le gene 
indicateur est lacZ et a ete place sous le controle d'une sequence 
promoteur/operateur caracterisee en ce que I'operateur a ete mute comme 
indique ci-apres. Ceci a donne lieu a la construction d'une souche indicatrice 
(SU202). Cette souche permet d* identifier, sur la base de la couleur des clones 
bacteriens, I'existence d* interactions proteine-proteine entre deux proteines ou 
domaines proteiques fusionnes respectivement au domaine de fixation a l*ADN 
de Lex A sauvage et LexA408 tels que decrits ci-apres. Cette souche permet de 
quantifier et d' analyser par mutagenese cette interaction. 

Cependant, le criblage d'une banque d'ADN necessite Tanalyse au 
minimum de 10^ clones. Ceci implique I'obtention sur milieu solide indicateur 
approprie (comme indique sur la figure 5) et I'experience de 10^ colonies 
bacteriennes dont il faudrait verifier la couleur (blanches ou roses en cas 
d interaction et rouges en absence d' interaction). Bien que theoriquement 
faisable, ceci est tres couteux non seulement en temps, mais egalement en 
materiel jetable. 

Pour identifier de nouvelies interactions, on a avantageusement recours au 
systeme de selection suivant. Dans ce type d' application, les interactions 
proteine-proteine ne sont plus visualisees sur la base de la couleur des clones 
bacteriens, mais sur le simple fait de leur existence. En effet, si le gene 
indicateur est remplace par un gene codant pour une proteine toxique : 

- r absence d' interaction proteine-proteine entre les parties Y et X de 
LexAj.gTWT-Y et de LexAi.gT^OS-X (comme decrit dans la figure 1) entraine 
la production de la proteine toxique et done la mort de la bacterie, 

- I'existence de ces interactions entraine la repression du gene toxique, la 
bacterie peut alors se diviser et donner lieu a une colonic sur milieu de culture 
solide. 

Un tel systeme base sur la survie des bacteries est bien evidemment plus 
facile a mettre en oeuvre. II est cependant evident que, comme dans tous les 
systemes de selection, il faut compter avec ce que I'on appelle des "faux 
positifs", c'est-a-dire des clones qui survivent pour des raisons autres que celles 
que Ton identifier, par exemple, des mutations spontanees qui inactivent le 
produit du gene toxique. Pour lever cette ambiguYte, on utilise la souche 
indicatrice SU202. En effet, seuls les clones poussant blancs ou roses sont 
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consideres comme "vrai positifs". les clones survivants dus a une mutation dans 
le gene toxique etant incapables de reprimer LacZ et poussant rouges. 

U gene toxique utilise est le gene sulA. II code pour une proteine SULA 
inhibitnce de la division cellulaire. En sa presence, la bacterie ne se divise plus 
et meurt. 

Pour I'instant, la construction consistant a mettre sulA sous le controie 
d'un operateur mut^ a ete menee a bien. En utilisant le systeme modele decrit 
ci-apres avec les proteines hybrides de I^xAi.87408-cJunZip et LexAj gyWT- 
cFosZip, on a montre que le systeme fonctionne. En effet, la construction {sulA 
sous le controie d'un operateur mut6) ne pent etre propagee dans un bote 
bactenen que si celui-ci porte egalement les genes codant pour les proteines 
hybrides de LexAi.87408-cJunZip et LexAi.gyWT-cFosZip. 

La mise en evidence de nouvelles interactions proteine-proteine necessite 
la constitution d'une banque d'ADN liguee en fusion a la suite du domaine de 
fixation. Pour cela, on a constitue une banque d'ADN qui est Iigu6e en ftision a 
la suite du domaine de fixation a TADN de LexA sauvage ou d'un mutant de 
LexA recojinaissant la partie sauvage de 1 'operateur mais avec une affinite 
momdre tels que ceux portant une des mutations suivantes G ^ D ou G S en 
position 23 (ref. 21). Cette alternative a pour but de limiter I'apparition de 
clones "faux positifs" qui peuvent etre dus a une interaction homodimerique trop 
forte d'une proteine ou domaine proteique present dans la banque. 

Description des flgures : 

- Figure 1 : la Figure 1 conceme le principe du fonctionnement du 
systeme double-hybride chez E. coli 

Le systeme est base sur le fait qu'un operateur mute contenant 1/2 
operateur sauvage (WT) et 1/2 operateur mute (408) n'est reconnu que par un 
dmiere mixte LexAWT/I^xA408. Un gene indicateur (/acZ represente par un 
rectangle vide) a ete mis sous le controie de cet operateur mixte (represente par 
un rectangle noir pour la partie non mutee et annotee WT et par un rectangle 
hachure pour la partie mutee et annotee 408). Des proteines ou des sous 
domaines de protdines X et Y susceptibles d'interagir sont fiisiomies aux 
domaines de fixation a I'ADN de LexAi-87WT (represente par une sphere 
noire) et de LexAi.87408 (representee par une sphere hachuree). LexAi.gTWT- 
X (represente par un rectangle hachure relie a une sphere hachuree) et 
LexAi.87408-Y(represent6 par un rectangle noir relie a une sphere noire) sont 
clones sur des plasmides compatibles et leur expression est contrdlee par un 
promoteur inductible {lacUVS, Oertel-Buchheit P., Lamerichs RMJN 
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Schnarr M. and Granger-Schnarr M. 1990 Mol. Gen. Genet. 222:40-48 Genetic 
analysis of the LexA repressor: isolation and characterization of LexA(Def) 
mutant proteins.), Les plasmides sont representes par des cercles dont une partie 
epaissie est separee en deux, Tune represente le gene codant pour les proteines, 
LexAi-87WT-X ou LexA i -87408- Y et T autre pour leur sequence promoteur, 
lacUV5). Ces proteines, LexAi-87WT-X et LexAi-87408-Y peuvent exister 
soit sous forme libre dans la bacterie, soit sous forme liee a TADN (representee 
par un rectangle noir relie a une sphere grisee entrelace avec un rectangle 
hachure relie a une sphere hachuree eux memes relies aux rectangles noirs et 
hachures representant I'operateur mixte ci-dessus decrit.). Le promoteur 
LacUVS est lui meme sous le controle d'une proteine regulatrice, le represseur 
lactose (represente par un carre aux coins arrondis et segmente en cartiers). Le 
gene codant pour ce represseur (gene lacl) est clone sur un episome, le facteur 
F' (Willetts N. and Skurray R. in E, coli and Salmonella Typhimurium, Cellular 
and Molecular Biology Ed. Neidhardt F.C. 1987, pp 1110-1133 et Oertel- 
Buccheit et al 1990) lui meme represente par un arc de cercle. Le represseur 
lactose pent exister soit sous forme libre dans la bacterie, soit sous forme liee a 
TADN (represente par un carre aux coins arrondis et segmente en cartiers relie 
aux sequences promoteurs, lacUV5 decrites ci-dessus). Le terme LexA(Def) 
signifie que la souche est depourvue de LexA endogene. 

- Figure 2 : la Figure 2 represente la construction de la souche indicatrice 
pour la mise en oeuvre d'un systeme double hybride chez E. coli. 

Le plasmide pRS415 (represente par le cercle contenant a 1' inter ieur 
rindication "pRS415" (SIMONS R.W., HOUMAN F. & KLECKNER N. 
(1987). Improved single and multicopy lac-based cloning vectors for protein and 
operon fusions. Gene 53:85-96) porte le gene lacZ, depourvu de region 
promoteur/operateur (represente par un epaississement du trait) et deux sites 
uniques de coupure pour deux enzymes de restriction EcoRI et BamHL "Lac " 
signifie que ce plasmide est incapable de produire le produit du gene lacZ 
puisqu'il est depourvu d'une sequence promoteur/operateur. Ce plasmide est 
coupe par ces deux enzymes puis ligue a un oligonucleotide de 70 paires de 
bases (70mer et represente par un rectangle noir) dont la sequence est la 
suivante ; 

GAATTCAATAGGGTTGATCTTTGTTGTCACTGGATGTACCGTACA 
TCC ATAC AGTAACTC AC AGGGGC ACCCTAGG-3 ' cet oligonucleotide 
introduit ainsi devant le gene lacZ une sequence promoteur/operateur permettant 
au gene lacZ d'etre transcript et regule par I'operateur mixte tel qu'il est defini 
dans la legende de la figure 1. Cette ligation symbolisee par une fleche entre le 



- wo 98/01579 



PCT/FR97/01133 



18 

plasmide et le VOmer cree le plasmide pGC202 (represente par le cercle 
contenant a I'interieur I'indication ••pGC202"). "Lac + " signifie que ce plasmide 
est maintenant capable de produire le produit du gene lacZ puisqu'il est pourvu 
d'une sequence promoteur/operateur. Le gene indicateur ainsi constitue 
(represente par un rectangle noir pour la sequence promoteur/operateur et par 
un rectangle blanc pour le gene lacZ) est ensuite transfere sur I'ADN d'un phage 
lambda (X) par un double evenement de recombinaison entre I'ADN plasmique 
et phagique (on entend par double evenement de recombinaison un mecanisme 
moleculaire complexe se produisant in vivo et aboutissant a I'echange de 
fragments d'ADN entre des molecules partiellement homologues, ceci est 
materialise sur la figure par deux croix entre le plasmide pGC 202 et unc droite 
symbolisant I'ADN du phage) donnant lieu au phage XGC 202. Ce phage a la 
capacite de s'int6grer dans le chromosome bacterien par un mecanisme 
complexe ayant lieu in vivo (Elledge et al. 1991). L'interet de ce systeme reside 
dans le fait que le gdne indicateur sera sur le chromosome bacterien et non plus 
sur un plasmide, ce qui perraet d'utiliser les vecteurs plasmidiques comme 
vehicule des prot6ines de fusion . 

- Figure 3 : la Figure 3 concerne la caract6risation de la souche SU202 en 
fonction de la quantite de proteines presentes dans la cellule. 

En abscisse, figurent les concentrations en IPTG (M) et en ordonnees. 
r expression relative de la p-galactosidase. 

La variation de la quantite de proteines est obtenue en cultivant les 
bacteries en presence de concentrations variables en IPTG, les genes codants 
pour les proteines chimeres etant sous le controle du promoteur inductible 
lacUV5. Les unites P-galactosidases sont mesurtes selon la methode d^crite par 
Miller (1972).L'expression relative de la P-galactosidase est calculee en faisant 
le rapport entre les unites P-galactosidases mesurees en presence des vecteurs 
d'expression et celles mesurees en leur absence, ces demieres correspondent a 
retat non reprim6 du gene lacZ. Les carres blancs correspondent aux valeurs 
mesurees lorsque la souche contient un plasmide exprimant LexAi-87408- 
cJunZip (pDL606, voir figures 6 et 7). Les cercles blancs correspondent aux 
valeurs mesurees lorsque la souche contient un plasmide exprimant le domaine 
de fixation a I'ADN seul (JWL96, Little JW and Hill S.A. (1985) Deletion 
within the hinge region of a specific DNA-binding protein Proc. Natl. Acad. Sci 
USA, S2:2301-2305). Les triangles blancs correspondent aux valeurs mesurees 
lorsque la souche contient un plasmide exprimant LexAi.87WT-cFosZip 
(PMS404, voir figures 8 et 9). Les carres noirs correspondent aux valeurs 
mesurees lorsque la souche contient a la fois le plasmide exprimant le domaine 
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de fixation a I'ADN seul (JWL96) et celui exprimant LexAi-87408-cJunZip 
(pDL606, voir figures 6 et 7). Les cercles noirs correspondent aux valeurs 
mesurees lorsque la souche contient a la fois le plasmide exprimant LexAi- 
87408-cJunZip (pDL606, voir figures 6 et 7) et celui exprimant LexAi-87WT- 
cFosZip (pMS404, voir figures 8 et 9). 

- Figure 4 : la Figure 4 represente la souche bacterienne SU202 qui 
permet de mesurer selectivement I'heterodimerisation de proteines de fusion 
susceptibles d'homodimeriser. 

En abscisse, figurent les concentrations en IPTG (M) et en ordonnees, 
r expression relative de la p-galactosidase. 

Des mutants de la glissiere a leucine ("leucine zipper") de Fos ont ete 
construits au laboratoire, ces mutants ont acquis la capacite a homodimeriser 
(contrairement au leucine zipper de Fos qui lui en est incapable), Quatre de ces 
mutants sont utilises ici et sont decrits dans: Porte D., Oertel-Buccheit P., 
Granger-Schnarr M. and Schnarr M. 1995 J. Biol. Chem. 22Q:2272 1-22730 Fos 
leucine zipper variants with increased association capacity, II s'agit : 

* d'un mutant pour lequel les cinq positions "a" de la glissiere 
("zipper") (definies dans Porte et al, 1995) sont occupees par des residus leucine 
(LexAi-87WT-cFosZipLLLLL) et qui est represente par des cercles blancs dans 
les figures 4 A, B et C, 

* d'un mutant pour iequel les cinq positions "a" de la glissiere 
("zipper") (definies dans Porte et al. 1995) sont occupees successivement par 
deux valines, une isoleucine, une phenylalanine et une valine (LexAi-87WT- 
cFosZipVVIFV) et qui est represente par des cercles noirs dans les figures 4A, 
B etc, 

* d'un mutant pour lequel les cinq positions "a" de la glissiere 
("zipper") (definies dans Porte et al. 1995) sont occupees successivement par 
deux isoleucines, une leucine et deux isoleucines (LexAi-87WT-cFosZipIILII) 
et qui est represente par des carres blancs dans les figures 4A, B et C, 

* d'un mutant pour lequel les cinq positions "a" de la glissiere 
("zipper") (definies dans Porte et aL 1995) sont occupees successivement par 
une isoleucine, une leucine, une phenylalanine, une leucine et une phenylalanine 
(LexAi-87WT-cFosZipILFLF) et qui est represente par des carres noirs dans 
les figures 4A, B et C, 

* les triangles noirs representent LexAi-87WT-cFosZip sauvage, 

* les courbes en pointilles representent les mesures faites en absence de 
plasmide. 
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Chacune de ces constructions est soit introduite separement dans les 
souches bacteriennes indicatrices (figure 4A pour la souche SU202 et 4B pour la 
souche SUlOl) soit co-introduites avec la proteine de fusion LexAi.87408- 
cJunZip (figure 4C). L'activite P-galactosidase est ensuite mesuree dans les 
conditions decrites par Miller et al. 1972 en fonction de concentrations variables 
en IPTG. En absence de proteine, le nombre d'unites mesurees reste constant, 
indiquant que le gene codant pour la (i-galactosidase est completement exprime, 
lorsque le nombre d'unites mesurees diminue, cela signifie que le gene codani 
pour la P-galactosidase est reprime, I'intensite de la repression etant fonction a 
la fois de la quantite de proteine presente dans la cellule (elle augmente lorsque 
Ton augmente la concentration en IPTG) et de la force d'interaction des 
proteines entre elles. 

A- La souche SU202 (comme decrite dans cette revendication) ne 
"repond" pas a I'homodimerisation {lacZ controle par un operateur mixte 
WT/408). 

B- L'homodimerisation des differentes proteines est mise en evidence dans 
une souche (SUlOl) dans laquelle lacZ est control^ par un operateur WTC-La 
souche SU202 mesure selectivement leur heterodimerisation avec 
LexA408JunZip 

- Figure 5 : sur la Figure 5, on voit que la souche SU 202 est transformee 
soit avec chacun des plasmides portant les genes codant pour les proteines de 
fusion LexAi.87408-cJunZip et I^xAi_87WT-cFosZip soit cotransformee avec 
les deux plasmides. Les cellules transformees sont laissees une nuit a 
temperature ambiante dans du LB additionne respectivement soit de kanamycine, 
chloramphenicol. ampiciUine soit de kanamycine, chloramphenicol, tetracycline 
soit des quatre antibiotiques: kanamycine, chloramphenicol, ampiciUine et 
tetracycline, avant d'etre dtalees sur milieu solide McConkey contenant les 
memes antibiotiques. Les cellules transformees par un seul des deux plasmides 
poussent rouges. Cette coloration signifie que le gene de la P-galactosidase n'est 
pas reprime par les proteines de fusion et que I'enzyme produit fermente le 
lactose du milieu. Les bacteries cotransformees par les deux plasmides poussent 
blanches, le gene de la p-galactosidase est reprime. 

- Figure 6 : la Figure 6 represente la carte du plasmide pDL606 (pour le 
clonage de "I'hameQon"). Les sites de restrictions indiques sont des sites 
uniques. Ap represente la gene codant pour la resistance a rampicilline, pl5A 
I'origine de replication du plasmide. Le vecteur est de type pACYC {New 
England Biolabs, Inc) : pACYC177. 
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- Figure 7 : la Figure 7 represente la sequence d'une partie du plasmide 
pDL606 codant pour la proteine de fusion LexAi-87408-cJunZip. Les sites 
indiques permettent de se reperer sur la carte de la figure 6, 

- Figure 8 : la Figure 8 represente la carte du plasmide pMS404. Les sites 
de restriction indiques sont des sites uniques. Tet represente le gene codant pour 
la resistance a la tetracycline, Ori I'origine de replication du plasmide. Le 
vecteur est de type pUC {New England Biolabs, Inc), 

' Figure 9 : la Figure 9 represente la sequence d'une partie du plasmide 
pMS404 codant pour la proteine de fusion LexAi-87WT-cFosZip. Les sites 
indiques permettent de se reperer sur la carte de la figure 8. 

- Figure 10 : la Figure 10 represente la carte du plasmide pL23B (vecteur 
plasmidique pour clonage de banque pour SU202). Les sites de restriction 
indiques sont des sites uniques. Tet represente le gene codant pour la resistance 
a la tetracycline, Ori Torigine de replication du plasmide. Ce plasmide porte le 
domaine de fixation a I'ADN d'un mutant de Lex A, LexA 1-823 (mutation 
G->S en position 23). Cette mutation n'affecte pas la specificite de 
reconnaissance (LexA23 reconnait la meme sequence que LexAWT) mais 
affecte la force avec laquelle cette interaction proteine/ADN se produit. En 
effet, pour ameliorer le systeme, nous avons trouve qu'en diminuant la force 
d* interaction entre Lex A et I'ADN, on gagnait en sensibilite. Ce plasmide est 
prevu pour le clonage d'une banque. 

- Figure 11 : la Figure 11 represente la sequence d'une partie du plasmide 
pL23B codant pour LexAi_8723. La banque peut etre clonee derriere 
LexAi-8723 en utilisant Tun des sites uniques suivants: Xhol, EcoRI, Sfil. En 
aval de ces sites trois codons stops (TAA) ont ete inseres dans les trois cadres 
de lecture afin de limiter la proteine de fusion. Les sites indiques permettent de 
se reperer sur la carte de la figure 10. 

L* invention sera completee par la description detaillee et les exemples qui 
suivent, donnes a titre illustratif et non limitatif . 

Principe du fonctionnement du systfeme double-hybride chez E. coli 
Le systeme double-hybride chez E. coli est base sur T utilisation de Lex A, 
represseur bacterien. LexA sauvage reconnait specifiquement et sous forme de 
dimeres une sequence palindromique de 16 paires de bases, CTGT (N)8 ACAG, 
appelee operateur, Les 4 paires de bases externes sont fortement conservees, 
alors que le motif central est plus variable. Chaque monomere de LexA est 
compose d'un domaine de fixation a I'ADN qui reconnait la sequence CTGT et 
d'un domaine de dimerisation indispensable a la fixation sur I'ADN puisque le 
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domaine de fixation a I'ADN depourvu de domaine de dimerisation. ne fixe que 
tres faiblement I'ADN. 

La litterature decrit des mutants de LexA ayant une nouvelle specificite de 
fixation a I'ADN. Celui qui a ete utilise, LexA408, porta une triple mutation 
(P40->A, N41->S, A42-^.S) et reconnait la sequence suivante CCGT fN)s 
ACGG. 

Le systeme selon la presente invention est base sur le fait qu'un operateur 
mute contenant 1/2 operateur sauvage et 1/2 operateur mute n'est reconnu que 
par un dimere mixte LexAWT/LexA408. Un gene indicateur {lacZ) egalement 
designe par gene reporter a ete mis sous le controle de cet operateur. Des 
proteines ou des sous domaines de proteines X et Y susceptibles d'interagir sont 
ensuite ftisionnes aux domaines de fixation a I'ADN, LexAi_87WT et de 
LexAi.87408. La figure 1 illustre ce systeme. LexAi.gyWT-X et 
LexAi. 87408- Y sont clones sur des plasmides compatibles et leur expression est 
controlee par un promoteur inductible {lacUVS). La souche indicatrice 
surexprimant le represseur du promoteur lactose (puisque lacF\), on peut alors 
moduler I'expression de LexAj.gTWT-X et LexAi.87408-Y en ajoutant des 
concentrations variables de I'inducteur IPTG. 
Ce systeme a deux utilisations principales: 

I)- X et Y peuvent etre des proteines ou des domaines de proteines 
caracterises et interagissants entre eux, ils conferent alors aux proteines hybrides 
la capacite de se fixer de fa?on stable sur I'ADN et ainsi de reprimer le gene 
lacZ. Une telle interaction peut etre visualisee sur un milieu indicateur approprie 
(par exemple Mac Conkey et decrit ci-apres) et peut egalement etre quantifiee 
par dosage du produit du gene lacZ, la P-galactosidase selon la methode decrite 
par Miller J.H.. 1972 "Experiments in Molecular Genetics, Cold Spring Harbor 
Lab. Cold Spring Harbor, NY) ; il est ainsi possible : 

1) de quantifier la force de cette interaction ; 

2) d' identifier les determinants de cette interaction (par mutagenese par 
exemple) ; 

3) d'identifier des molecules capables d'interferer avec cette interaction et 
susceptibles d'etre utilisees in vivo ; petites molecules susceptibles d'etre mises 
dans le milieu de culture et de passer a travers la paroi bacterienne. 

II)- X (ou Y) est une prot6ine ou un domaine de proteine susceptible 
d'interagir avec une ou des proteine(s) encore inconnue(s) que I'on veut 
identifier. On greffe alors sur Y (ou X) une banque, cette banque etant 
cointroduite dans la souche indicatrice avec le gene codant pour la proteine 
hybride dont on cherche le ou les partenaires. Tout 61ement de la banque codant 
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pour une proteine ou un domaine de proteine interagissant avec X (ou Y) donne 
lieu a un clone bacterien dont la couleur sur milieu approprie est differente de 
ceux pour lesquels il n'y a pas d' interaction. Ce ou ces elements sont alors 
identifies par sequen?age, 

EXEMPLE 1 : 

Construction de la souche indicatrice pour la mise en oeuvre d^un 
systeme double hy bride chez E. coli 
Cette construction necessite : 

1) le clonage de lacZ sous le controle d'un promoteur regule par un 
operateur de type CCGT (N)8 ACAG; 

2) de faire passer cette construction sur le chromose d'un bote bacterien 
delete de son operon lactose, deficient en LexA chromosomique et exprimant le 
represseur lactose, souche JL1434 (Little J.W. & Hill S.A. 1985 Deletions 
within a hinge region of a specific DNA-binding protein. Proc, Natl. Acad, Sci. 
USA S2:2301-2305 et ceci par Tintermediaire d'un phage lambda (Figure 2). 

1, Construction de plasmides portant le gene lacZ place sous le 
controle d'un operateur mute WT / 408 

Le plasmide pRS415 portant le gene lacZ, depourvu de region 
promoteur/operateur (Simons R.W., Houman F. & Kleckner N, (1987). 
Improved single and multicopy lac-based cloning vectors for protein and operon 
fusions. Gene 52:85-96.) est ouvert aux sites de restriction EcoRI/BamHL Entre 
ces deux sites uniques de restriction, a ete insere 1* oligonucleotide double brin 
suivant: 

ii'-fSAATTriiATAr:nnTTnATnTTTfiTTfiTCACTGGATGTA CCGTACATCCATA CAGTAACTCACAGGGGCACCCTAGG-3' 

(bases en caractere gras = elements du promoteur, bases soulignees = 
operateur) creant ainsi le plasmide pGC202. 

2. Isolement de bacteriophages Lac recombinants 

La souche JL1434 (LexA(Def), Lac"), transformee par les plasmides 
pGC202, a ete infectee par le bacteriophage X^d (Lac** Hochschild A. & 
Ptashne M. (1988). Interaction at a distance between X repressors disrupts gene 
activation. Nature 226:353-357) dont le genome porte immediatement a gauche 
d'un gene lacZ depourvu de promoteur et de codon d' initiation (ATG) de la 
traduction, une sequence derivant du vecteur pBR322 et que Ton retrouve 
egalement a gauche du site de clonage EcoRI du plasmide pRS415 (voir figure 
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2). Grace aux sequences homologues situees de pait et d'autre de la sequence 
promoteur/operateur/initiateur" et suite a un double evenement de 
recombmaison entre I'ADN plasmique et phagique, le gene lacZ se retrouve 
sous le controle de la region promoteur/operateur clone dans pGC202 donnant 
lieu au phage A,GC 202. 



3 Isolement de bacteries lysogenes pour les bacteriophages Lac"*" 
recombinants ^ 

L'isolement de bac«ri=s lyscgenes a pour but d'obtemr rimegration stable 
du p^ge recombmant dans le chromosome bacerien, qui s'y trouve alors 4 
e«t de prophage. Ceci se fait a patir d'une deuxieme infection des bacteries 
JL1434 avec des mimpr6parations du phage prdc«dem„en, obtenu afln de se 
debarrasser du plasmide initial et de s'assut^r ainsi que le cantctere Lac+ est 
bien porte par le phage. 

Apres infection de la souche JL1434, les phages X recombinants 
connnencent un cycle lysogene qui conduit a Tintegration stable par 
recombinaison site-specifique de leurs genomes (et done du gene lacZ contrL 
par 1 element promoteurs/operateurs decrit ci-dessus) dans le chromosome 

lysogene Lac+ SU202 a ainsi ete isolee. Cette souche indicatrice poxte les genes 
de resistance a la Kanamycine et au Chloramphenicol. 

Description des plasmides porteurs des proteines hybrides 

L^s genes codant pour les proteines hybrides sont portes par deux vecteurs 
Plasmuhques compatibles portant des origines de replication differentes (pMBl 
ou pl5A) amsi que la selection pour deux marqueurs differents (tetR ou ampR ) 
rendant ainsi possible leur maintien simultane dans la meme bacterie bote. 

Utilisation de la souche SU202 pour identiHer et quantifier des 
interactions prot^ine/prot^ine 

suiv»„t" '"""^"'^ " ^W-nires 

suivantes : l^xAl.87408-cJunZip et LexA,.87WT-cFosZip, eiles son. 
constttuees du domaine de fixation i I'ADN (mutant 408 ou sauvage (WT)) du 
represseur UxA (aa 1-87) e, du domaine de din,6risation (glissiire a leucine ou 
leucme ztpper") des oncoprotSines cJun (aa 277-315) et cPos (aa 102-200) 

pDLei^r**"'/'^""'.'"" LexA,.87408-c,u„Zip est porte par le plasmide 
PDL606 (vo,r f.gures 6 et 7). La figure 6 represente une carte de l ensemble du 
plasm.de accompagn* des sites uniques de restriction, le vecteur est un 
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pACYC177 {New England Biolabs, Inc) ; il porte la resistance a rampicilline 
et pi 5 A comme origine de replication. La figure 7 represente la partie de la 
sequence de ce plasmide correspondant a la proteine de fusion, cette sequence 
etant reperable sur la carte generale a I'aide des sites de restriction. 

Le gene codant pour LexAi.gyWT-cFosZip est porte par le plasmide 
pMS404 (voir figures 8 et 9). La figure 8 represente une carte de Tensemble du 
plasmide accompagne des sites uniques de restriction, le vecteur est un plasmide 
apparente a un pBR322 (New England Biolabs, Inc.) ; il porte la resistance a la 
tetracycline et pMBl comme origine de replication. La figure 9 represente la 
partie de la sequence de ce plasmide correspondant a la proteine de fusion, cette 
sequence etant reperable sur la carte generale a I'aide des sites de restriction. 

Ces domaines de dimerisation sont tels que les homodimeres Jun/Jun sont 
beaucoup moins stables que les heterodimeres Jun/Fos, mais cependant 
davantage que les homodimeres Fos/Fos qui n'existent pas in vivo (Sassone- 
Corsi P., Ransone LJ., Lamph W.W. & Verma LM. (1988). Direct interaction 
between f OS and jun nuclear oncoproteins: role of the "leucine-zipper" domain. 
Nature (London) 2M:692-695.). 

Les genes codant pour ces deux proteines de fusion sont controles par le 
promoteur inductible lacUVS, Les souches indicatrices surexprimant ce 
represseur (puisque lacFi), permettent de moduler 1' expression de LexAi- 
87408-cJunZip et LexAi.87WT-cFosZip en presence de differentes 
concentrations en inducteur (IPTG). 

Test qualitatif 

La souche SU 202 est transformee soit avec chacun des plasmides portant 
les genes codant pour les proteines de fusion LexAi.87408-cJunZip et LexAi- 
87WT-cFosZip soit cotransformee avec les deux plasmides. Les cellules 
transformees sont laissees une nuit a temperature ambiante dans du LB (Maniatis 
et al.) additionne respectivement soit de kanamycine, chloramphenicol, 
ampicilline soit de kanamycine, chloramphenicol, tetracycline soit des quatre 
antibiotiques: kanamycine, chloramphenicol, ampicilline et tetracycline, avant 
d'etre etalees sur milieu McConkey contenant les memes antibiotiques. La 
figure 5 montre, apres repiquage sur une meme boite, les resultats obtenus. 

Ce type de milieu de culture contient entre autre du lactose qui est 
hydrolyse par la p-galactosidase en allolactose. L'allolactose etant T inducteur 
naturel du promoteur lactose, lorsque les bacteries possedant I'un ou les deux 
genes codant pour les proteines chimeres sont cultivees sur ce milieu, ceux-ci 
sont partiellement induits. On estime que 1' induction correspond a celle que Ton 
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observe en milieu LB additionne de 10-5 M en IPTG. II a ete observe une 
difference importante dans la coloration des clones bacteriens indiquant que la 
souche mdicatrice construite repondait aux criteres defrnis, en effet : 

- les cellules transformees par un seul des deux plasmides poussent rouges- 
cette coloration signifie que le gene de la P-galactosidase n'est pas reprime pa; 
les protemes chimeres et que I'enzyme produit fermente le lactose du milieu- 
dans le cas LexAi-87408-cJunZip, les homodimeres qui sont susceptibles de se 
former sont incapables in vivo de reconnaitre I'operateur mute et done de 
repr.mer le gene lacZ. En ce qui concerne la glissiere a leucine ("leucine 
zipper ) de Fos. la reponse etait attendue puisqu'il n'homodimerise que tres 
mal; 

- les bacteries cotransformees par les deux plasmides poussent blanches la 
P-galactosidase n'est done pas produite par les cellules; cette double 
transformation permet a la cellule de produire simultanement les deux proteines 
chimeres LexAi.87408-cJunZip et LexAi-gVWT-cFosZip; I'absence de 
production de la P-galactosidase indique que I'heterodimere LexAi 87408- 
cJunZip/LexAi-87WT-cFosZip, est contrairement aux homodimeres, capable de 
repruner le gene lacZ. 

Cette souche indicatrice est done bien fonctiomielle, elle permet de mettre 
en evidence des interactions proteine/proteine sur la simple base de la couleur 
des clones, elle est tres specifique et permet de discriminer entre homo- et 
heterodimerisation. 

Test quantitatif 

L-efficacite avec laquelle le gene indicateur est reprimee pent etre mesuree 
quantitativement par dosage in vitro de I'activite P-galactosidase. Ce test est 
effectue dans les conditions decrites par Miller J.H. (1972) dans Experiments in 
molecular genetics. Cold Spring Harbor Laboratory, Cold Spring Harbor NY 

Les valeurs des dosages decrits repr^sentent la moyenne d'au moins trois 
experiences independantes et sont realisees en presence de concentrations 
variables en IPTG. 

La figure 3 montre que: 

* quelle que soit la concentration en IPTG, la souche non transformee 
produit le meme nombre d'unites P-galactosidase (en moyemie 2500 unites)- 

* lorsqu'elle est transformee avec le plasmide codant pour LexAi 87WT- 
cFosZip et quelle que soit la concentration en IPTG (c'est-a-dire meme en 
surexprimant la proteine chimere), le nombre d'unites ne varie pas- 
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* lorsqu'elle porte les deux proteines chimeres, on observe une repression 
tres forte du gene reporter ( le nombre d'unites p-galactosidase chute a 20 pour 
les concentrations 10"^ et lO'^ M en IPTG); 

* cette repression est due a T interaction specifique entre les parties 
glissiere a leucine ("leucine zippers") des proteines chimeres aboutissant a la 
formation d'heterodimeres actifs, et non pas a la simple coexistence de deux 
proteines chimeres dont les domaines de liaison a I'ADN seraient capables de se 
fixer independamment sur chaque demi site de I'operateur mute; en effet, 
lorsque la souche porte le gene codant pour le domaine de fixation a TADN WT 
de Lex A depourvu de son domaine de dimerisation et celui codant pour LexAi- 
87408-cJunZip, on n'observe pas de repression du gene reporter. 

On dispose done d'un test permettant de mettre en evidence des 
interactions proteine/proteine utilisable comme crible mais aussi avec la 
possibilite de mesurer et de comparer la force de ces interactions. 

Recherche et identification de mutants affectes dans ces interactions 

Cette souche pent etre egalement utilisee pour identifier les determinants 
de ces interactions soit par mutagenese aleatoire soit par mutagenese dirigee. 
Par exemple, il avait ete emis I'hypothese que la specificite d'heterodimerisation 
entre les glissieres ("zippers") de Jun et de Fos etait due a la non 
homodimerisation de la glissiere ("zipper") de Fos. Cette souche a permis de 
montrer que tel n' etait pas le cas puisque de mutants de Fos capables 
d'homodimeriser n*ont pas perdu cette specificite (figure 4). 

Les cellules transformees uniquement par les plasmides codant pour les 
mutants de Fos poussent rouges sur milieu McConkey. L' homodimerisation 
n'est done pas detectee dans cette souche. 

Dans le cas ou les bacteries produisent en plus LexAi-87408-cJunZip, 
elles poussent blanches si les mutants de Fos sont ameliores dans leur interaction 
proteine/proteine par rapport a Fos sauvage, et roses si les mutants de Fos sont 
moins bons. L'intensite de la couleur est toujours inversement proportionnelle a 
la capacite d'heterodimerisation (dosage p-galactosidase). 

Utilisation de la souche SU202 pour identifier le ou les partenaires 
d*une proteine ou d^un domaine proteique caracterise 

Deux plasmides sont utilises: 

1- le plasmide portant la proteine ou le domaine de proteine caracterise 
pour lequel on veut identifier le ou les partenaires fusionne(s) au domaine de 
fixation a TADN de LexA408, pDL606 : constituant "I'hamegon*'. 
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2- le plasmide portant la banque, pLE23B (voir figures 10 et 11). La 
figure 10 represente une carte de Tensemble du plasmide accompagne des sites 
uniques de restriction, le vecteur est un plasmide apparente a un pBR322 {New 
England Biolabs, Inc.) il porte la resistance a la tetracycline et pMBl comme 
ongme de replication. La figure 11 represente la partie de la sequence de ce 
plasm.de correspondant a la proteine de ftision. cette sequence etant reperable 
sur la carte generale a I'aide des sites de restriction. 

Les deux plasmides sont simultanement introduits dans la souche SU202 et 
les bacteries transformees sont : 

- soit directement selectionnees sur milieu solide LB + antibiotiques 
(kanamycine, chloramphenicol, ampicilline et tetracycline), les clones positifs 
etant ensuite reveles par repliques des boites sur milieu indicateur McConkey + 
les memes antibiotiques, 

- soit selectionnees en milieu liquide LB + antibiotiques (kanamycine, 
chloramphenicol, ampicilline et tetracycline) pendant une nuit. puis revelees par 
etalement des cultures sur milieu indicateur McConkey + les memes 
antibiotiques. 

Chaque clone porte un element de banque different codant pour une 
proteine ou un domaine de proteine different, lorsque cette proteine ou ce 
domaine de proteine est susceptible d'etablir des interactions proteine/proteine 
avec "I'hamegon", il donne lieu a un clone Wane ou rose parmi un tapis de 
clones rouges, qui eux representent tous les elements de la banque codant pour 
des proteines ou des domaines de proteine n'interagissant pas avec Thamegon. 

La constitution de la banque passe par I'intermediaire d'une navette phage 
Elledge S.J. etal., 1991, Proc. Natl. Acad. Sci. USA, SS:1731-1735. ";iYes: 
multifunctional cDNA expression vector for the isolation of genes by 
complementation of yeast and E. coli mutations". 

EXEMPLE 2 : 

Construction du systfeme de selection raettant en oeuvre un gene 
indicateur codant pour une proteine toxique : 

Modification de la sequence operateur du gdne sulA de maniere a rendre 
son expression dependante d' interactions heterodimeriques entre des proteines 
ou domaines proteiques X et Y fusionnes respectivement aux domaines de 
fixation a 1' ADN de LexA408 et LexAWT. 

Cette modification consiste a introduire une mutation ponctuelle dans la 
sequence operateur naturelle de sulA : 

CTGTACATCCATACAG = operateur WT. 
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CCGTACATCCATACAG = operateur mixte 408/WT. 

Le gene sulA est in vivo reprime par Lex A, T introduction de la mutation 
op408 empeche cette repression, le produit du gene est alors synthetise et les 
bacteries meurent, rendant impossible la selection d'une telle construction. II est 
done necessaire de trouver un moyen autre que la repression pour controler la 
production de SULA. 

Prealablement a I'instauration de cette mutation, on a introduit de deux a 
quatre codons STOP dans la phase codante de sulA (un codon STOP est une 
sequence specifique de trois paires de bases servant de signal d'arret a la 
machinerie traductionnelle). Ainsi, seule une proteine tronquee inactive est 
produite et ceci permet I'instauration de la mutation op408. 

Lorsque le systeme est mis en oeuvre, il suffit d'utiliser un hote bacterien 
porteur d'un ARNt suppresseur de ce codon STOP (un ARNt suppresseur est 
ARNt capable de reconnaitre un codon STOP et de permettre la poursuite de la 
traduction). L*h6te bacterien (SU202) que Ton utilise etant porteur de I'ARNt 
suppresseur SupE qui, a la place des codons STOP (UAG), introduit un residu 
Glutamine, on a remplace de deux a quatre residus glutamine par des codons 
TAG. 

Le gene sulA clone dans un plasmide a ete donne par S. Cole (Institut 
Pasteur, Paris). On a introduit les codons STOP TAG au niveau des Glutamines 
42,47 d*une part, et 42,47 55 et 56 d*autre part, donnant lieu a des 
constructions appelees respectivement sulA 2STOP et sulA 4STOP, Ceci a ete 
realise par mutagenese dirigee selon la methode decrite par Eckstein 
(Nakamaye, K. et Eckstein, F. Nucleic Acids Res. 1986, 14:9679-9698) et en 
utilisant un kit commercialise par la societe Amersham. 

La mutation 408 a ensuite etc introduite par le meme procede de 
mutagenese et des resultats identiques ont ete obtenus avec sulA 2STOP et sulA 
4STOP. Les constructions obtenues ont ete appelees op408/opWT sulA 2STOP et 
op408/opWr sulA 4STOP. 

Mise en oeuvre du systeme de selection ; 

Le systeme a ete teste dans la souche SU202 portant un ARNt 
suppresseur, SupE. Les resultats suivants ont ete observes. 

i) op408/opWr sulA 2STOP ou op408/opWr sulA 4STOP ne peuvent pas 
etre introduits dans la souche. En effet, quelle que soit la methode de 
transformation utilisee (chlorure de calcium ou electroporation), aucun clone n'a 
ete obtenu, alors qu'un plasmide identique mais ne portant pas la construction 
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donne lieu a 200 ou 2000 clones par nanogramme de plasmide selon la methode 
de transformation utilisee ; 

ii) par contre, op408/opWr sulA 2STOP ou op408/opWr sulA 4STOP 
peuvent etre introduits dans la souche SU202 s'ils sont co-transformes avec des 
plasmides portant les genes codant pour les proteine de fusion LexA, .74O8- 
cJunZip et UxAi.gyWT-cFosZip. 

Dans la premiere experience, I'operation de sulA n'est pas occupe et les 
codons STOP sont "lus" par I'ARNt suppresseur, SupE. La proteine SULA est 
produite et provoque la mort de la bacterie. 

Dans la deuxieme experience, les heterodimeres LexAi.87408cJunZip / 
l^xAi.87WT-cFosZip sont capables de se fixer sur I'operateur de sulA et 
empechent ainsi la production de la proteine SULA, la bacterie peut se diviser et 
donner lieu a des clones. 
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REVENDICATIONS 



1- Utilisation d'une sequence d'ADN comprenant 

- una sequence nucleotidique codant nour ime o.^.- • 
indicateur). ^ P'''^^'"^ mdicatrice (gene 

- un promoteur, 

- un operateur mute, 

ladite sequence nucleotidique etant soik . . 

operateur contenant deux sequence, r^^f denvant d un 

sequences es. ™«e (mutation 1), tandis que Tautre es ^1!, " 
mu.^ .e fa.on .nencieuse ou compete une^nuttatio" SI J.^^^^^^^^^ : 
la susattc mutation ,, ,a transcription du gine indicateur ^tant r^TJ Z 
pr^^mes .tutrices sous forme d'h^t^rodim^es via ,eur siteTZ n 

qre?a Z ''a^re ia sequence 

une mutation 2, les homodmtires susceptibles d'etre formes a partir de chacun 

t^ic::— ^-^^ - 

- pour dftecter ou quantifier des interactions entre deux proteines on 

Tz:::^:T::^r7 ~ 

. ■ proteme ou domaine protaque determin^f^l 

mteracttons torn reva6es lorsqu'il y a rSnressinn 1 1= , 
gene indicateur r™.. - ^ ^ " "^P-^^ssion de la transcription du susdit 

comprllt • ~ c-haerodim^re., 

contelTe Tirdrfi"",""' ""^ " "^''-^ ^^'o" 
reconnartre sp.cif,q,l: IT a ^1"^ T"^. ^"^"""'"^ 

rr rdj:" -~ ^^^^^^ : 

contenant le site de fixation a rADNr h P'-^'^'ne de fusion 
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silencieuse ou comportant la mutation 2 de I'operateur mute, le susdit site de 
fixation etant fusionne a 1' autre des deux proteines ou a T autre des deux 
domaines proteiques, implique(e) dans les susdites interactions. 

2. Sequence d'ADN comprenant : 

- une sequence nucleotidique codant pour une proteine indicatrice (gene 
indicateur), 

- un promoteur, 

- un opera teur mute, 

ladite sequence nucleotidique etant sous le controle d'un promoteur comprenant 
un operateur mute contenant deux sequences et derivant d'un operateur 
contenant deux sequences repetees inversees (palindrome), cet operateur etant 
tel que, a I'etat non mute (sauvage), il entraine la repression de la transcription 
du gene indicateur, lorsque des proteines regulatrices sous forme d'homodimere 
se fixent sur chacune desdites sequences repetees inversees via leur site de 
fixation a TADN, cet operateur mute etant tel que Tune de ses sequences est 
mutee (mutation 1), tandis que Tautre est a I'etat sauvage, ou mutee de fa^on 
silencieuse ou comporte une mutation differente (mutation 2) de la susdite 
mutation 1 , la transcription du gene indicateur etant reprimee par des proteines 
regulatrices sous forme d'heterodimeres via leur site de fixation a TADN, 
chaque monomere de ces heterodimeres etant tel qu'il reconnaisse 
specifiquement I'un la sequence comportant la mutation 1, 1' autre la sequence 
qui est a I'etat sauvage, ou qui est mute de fa?on silencieuse ou qui comporte 
une mutation 2, les homodimeres susceptibles d'etre formes a partir de chacun 
des monomeres etant incapables de reprimer la transcription du susdit gene 
indicateur, 

ladite mutation 1 etant en outre telle qu'elle est reconnue specifiquement 
par une proteine regulatrice comportant un site de fixation a 1' ADN entrant dans 
la constitution d'une premiere proteine de fusion, lequel site de fixation est 
fusionne avec une proteine ou un domaine proteique susceptible d'interagir avec 
une autre proteine ou un autre domaine proteique entrant dans la constitution 
d'une deuxieme proteine de fusion contenant le site de fixation a I'ADN d'une 
proteine regulatrice susceptible de reconnaitre specifiquement la sequence non 
mutee, ou mutee de fagon silencieuse ou comportant la mutation 2. 

3. Sequence d'ADN selon la revendication 2, caracterisee en ce qu'elle 
comprend un operateur mute contenant deux sequences et derivant d'un 
operateur contenant deux sequences repetees inversees (palindrome). Tune de 
ces deux sequences etant mutee, et T autre etant a I'etat sauvage. 
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4. Sequence d'ADN selon Tune des revendications 2 ou 3, caracterisee en 
ce que I'operateur mute contient les sequences suivantes : 



CCGT et ACAG 



espacees par une sequence d'environ 3 a environ 20 nucleotides, et notamment 
de 8 a 12, et avantageusement 8 nucleotides, et notanunent caracterisee en ce 
que I'operateur mute contient la sequence suivante : 

5-CGGAATTCAATAGGGTTGATCTTTGTTGTCACTGGATGT 
ACCGTACATCCATACAGTAACTCACAGGGGC-3' 



ce que 



5. Sequence d'ADN selon Tune des revendications 3 a 4, caracterisee en 



la sequence nucleotidique codant pour la proteine indicatrice est le gene lacZ 
Chez E. coll, codant pour la p-galactosidase, 

I'operateur mute contient deux sequences et derive d'un operateur contenant 
deux sequences repetees inversees (palindrome). Tune de ces deux sequences 
etant mutee. et I'autre etant a I'etat sauvage, la sequence mutee etant de 
preference celle situee en aval de la sequence a Tetat sauvage, 

la sequence sauvage etant reconnue specifiquement par la proteine LexA 
sauvage ou par un fragment de LexA contenant le site de fixation a I'ADN 
notamment un fragment defini par les positions 1 a x de LexA, x variant de 69 a 
87, et notamment par les fragments 1 a 69 ou 1 a 87 de LexA, 

et la sequence mutee etant reconnue par la proteine LexA mutee ou par un 
fragment mut6 de LexA contenant le site de fixation a I'ADN, notamment un 
fragment mute de LexA correspondant a celui defini par les positions 1 a x de 
LexA. X variant de 69 k 87, et notamment par les fragments 1 a 69 ou 1 a 87, et 
les mutations de LexA etant avantageusement P40 A, N41 ^ S A42 S 
le domaine de dimerisation de LexA etant absent k la fois de LexA ou du 
fragment de LexA et de LexA mute ou du fragment mute de LexA. 

6. Complexe entre 

- une sequence d'ADN comprenant une sequence nucleotidique codant pour une 
proteme mdicatrice. ladite sequence nucleotidique etant sous le controle d'un 
promoteur comprenant un operateur mute contenant deux sequences et derivant 
d'un operateur contenant deux s6quences repetees inversees (palindrome) cet 
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operateur etant tel que, a Tetat non mute (sauvage), il entraine la repression de 
la transcription du gene indicateur, lorsque des proteines regulatrices sous forme 
d'homodimere sc fixent sur chacune desdites sequences repetees inversees via 
leur site de fixation a TADN, cet operateur mute etant tel que Tune de ses 
sequences est mutee (mutation 1), tandis que 1' autre est a I'etat sauvage, ou 
mutee de fa?on silencieuse ou comporte une mutation differente (mutation 2) de 
la susdite mutation 1, la transcription du gene indicateur etant reprimee par des 
proteines regulatrices sous forme d*heterodimeres via leur site de fixation a 
I'ADN, chaque monomere de ces heterodimeres etant tel qu*il reconnaisse 
specifiquement Tun la sequence comportant la mutation 1, T autre la sequence 
qui est a I'etat sauvage, ou qui est mute de faQon silencieuse ou qui comporte 
une mutation 2, les homodimeres susceptibles d'etre fournis a partir de chacun 
des monomeres etant incapables de reprimer la transcription du susdit gene 
indicateur, 

- et des heterodimeres dont les monomeres les constituant (respectivement 
premier monomere et deuxieme monomere) sont impliques entre eux dans une 
interaction proteine/proteine : 

1) le premier monomere etant tel qu*il contient une premiere proteine de 
fusion contenant le site de fixation a TADN d'une proteine regulatrice 
susceptible de reconnaitre specifiquement la sequence de 1' operateur mute 
contenant la mutation 1, le susdit site de fixation etant fusionne a Tune des deux 
proteines ou a I'un des deux domaines proteiques, implique(e) dans les susdites 
interactions, 

2) le deuxieme monomere etant tel quMl contient une deuxieme proteine de 
fusion contenant le site de fixation a I'ADN d'une proteine regulatrice 
susceptible de reconnaitre specifiquement la sequence non mutee, ou mutee de 
fagon silencieuse ou comportant la mutation 2 de 1' operateur mute, le susdit site 
de fixation etant fusionne a T autre des deux proteines ou a T autre des deux 
domaines proteiques, implique(e) dans les susdites interactions. 

7. Complexe selon la revendication 6, caracterise en ce que : 

- la sequence d'ADN est telle que definie selon Tunc quelconque des 
revendications 3 a 5, et en ce que 

- les heterodimeres contiennent : 

1) un monomere contenant une premiere proteine de fusion contenant le 
site de fixation a I'ADN de LexA mute ou d'un fragment mute de LexA 
reconnaissant la sequence de 1' operateur mute contenant la mutation 1, lequel 
site de fixation est fusionne avec une proteine determinee ou un fragment 
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proteique determine susceptible d'etre implique dans une interaction selon la 
revendication 1, laquelle proteine ou lequel domaine proteique contient par 
exemple un domaine d'activation ou de dimerisation, 

2) un monomere contenant une deuxieme pro'teine de fusion contenant le 
site de fixation a TADN de LexA sauvage, ou porteur d'une mutation 
silenceuse ou d'une mutation 2 ou d'un fragment de LexA reconnaissant la 
sequence nan mutee de LexA ou mutee de fa.on silencieuse ou comportant une 
mutation 2, lequel site de fixation est ftisionne avec une proteine determinee ou 
un fragment proteique determine, contenant par exemple une proteine ou un 
domame proteique susceptible d'interagir avec la proteine ou le fragment 
proteique defini en 1) ou avec les susdits domaines deactivation ou de 
dimerisation. 

8. Hote cellulaire contenant une sequence d'ADN selon la revendication 2. 

9. Procede pour d^tecter et quantifier des interactions entre deux proteines 
ou fragments de proteines, caracterise 

- en ce que I'on met en presence des sequences nucleotidiques codant 
respectivement pour le premier et le deuxieme monomere contenant 
respectivement une premiere et une deuxieme proteine de fusion telle que 
defime dans la revendication 1, avec une sequence d'ADN selon I'une 
quelconque des revendications 2 a 5, et 

- en ce que I'on detecte I'eventuelle repression de la transcription du gene 
indicateur tel que d6fini a la revendication 1, notamment par transfection d'un 
hote cellulaire selon la revendication 8. avec des vecteurs contenant. d'une part 
les susdites sequences nucleotidiques codant respectivement pour le premier et le 
deuxieme monomere contenant respectivement la premiere et la deuxieme 
proteine de fusion et. d'autre part, les elements necessaires a I'expression des 
susdits monomeres. 



10. Procede pour identifier une proteine interagissant avec une proteine 
determinee, caracteris6 

- en ce que I'on met en presence les elements suivants : 

. une sequence nucleotidique codant pour un premier monomere 

contenant une premiere proteine de fusion entre, d'une part, une proteine 

regulatrice selon la revendication 1 et, d'autre part, la proteine determinee 
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. une banque genomique, contenant notamment des fragments d'ADN, 
et notamment d'ADNc, chacun etant susceptible de coder pour une proteine 
interagissant avec la proteine determinee, chacun des differents elements de la 
banque genomique etant respectivement fusionne a la sequence codant pour une 
proteine regulatrice selon la revendication 1 , 

, une sequence d'ADN selon Tune quelconque des revendications 2 a 5, 

et 

- en ce que Ton detecte I'eventuelle repression de la transcription de la 
sequence nucleotidique codant pour une proteine indicatrice selon la 
revendication 1, notamment par transfection d'un bote cellulaire selon la 
revendication 8, d'une part, avec un vecteur contenant la sequence nucleotidique 
codant pour le susdit premier monomere contenant la premiere proteine de 
fusion et, d'autre part, un ensemble de vecteurs contenant une sequence 
nucleotidique codant pour un deuxieme monomere contenant une deuxieme 
proteine de fusion, chaque sequence nucleotidique codant pour chaque deuxieme 
monomere contenant la sequence nucleotidique codant pour la proteine 
regulatrice selon la revendication 1, et en aval de celle-ci Tun des elements 
d'ADN de la susdite banque, tous les vecteurs contenant en outre les elements 
necessaires a 1* expression des susdits monomeres. 
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FIGURE 8 
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FIGURE 10 
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